清华+中科院+理想汽车联合研发!LightVLA重塑VLA技术格局
2025年9月23日,有个叫LightVLA的技术火了,它专门解决VLA模型的难题,还第一次做到了性能和效率一起提升。
2025年9月23日,有个叫LightVLA的技术火了,它专门解决VLA模型的难题,还第一次做到了性能和效率一起提升。
过去的解决办法要么笨要么糙:要么固定剪掉一半令牌,结果把有用的信息也扔了;要么靠人工设定规则,调来调去也达不到平衡。这就形成了个死循环:想让模型跑得快,就得牺牲accuracy;想让它干活准,就得容忍慢半拍。
保留无用 token 导致性能下降: 当在 LightVLA 已保留的 k 个 token 之外再补充 k 个随机 token 时,整体性能反而下降,说明 LightVLA 已经捕捉到所有关键信息,额外的随机 token 只会引入噪声与干扰。丢弃有用 toke
本文共同第一作者蒋体通,清华大学直博五年级学生,研究方向是VLA、自动驾驶和人机交互等。共同第一作者蒋雪枫,中国科学院计算技术研究所直博五年级学生,研究方向聚焦弱监督学习,多模态大模型应用和生成式自动驾驶等。本文通讯作者朗咸朋,理想汽车智能驾驶副总裁。